課程資訊
課程名稱
語料處理方法一
Corpus Processing Method (Ⅰ) 
開課學期
101-1 
授課對象
文學院  語言學研究所  
授課教師
謝舒凱 
課號
LING7503 
課程識別碼
142EM1010 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期三6,7,8(13:20~16:20) 
上課地點
樂學館304 
備註
本課程以英語授課。
總人數上限:12人
外系人數限制:5人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1011corpusR 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

語料的處理是任何語言分析的前置作業之一。語料的處理,背後涉及許多經驗研究的方法論,與資料處理的觀念與技術。本課程是一系列之語料處理課程之一,主要介紹的是語料處理的方法論入門。本課程之設計,是以語言所與對語言學經驗方法研究有興趣之研究生為對象。本課程的進行方式,除了講授觀念、研讀相關文獻與討論之外,尚有演習課。

在演習課中,將以實際之語料當範本 (包括重要之語料庫、詞彙知識庫與詞彙網路),學習以簡單之程式處理語料。本課程不需要修課者具備任何程式設計背景。
 

課程目標
本課程之目標在於
(一)、對於語言學的經驗研究方法有入門的認識;
(二)、對於各種語料之處理有利用電腦實作上的經驗;
(三)、能將上述觀念與技能應用在論文與研究上。
 
課程要求
 
預期每週課後學習時數
 
Office Hours
每週三 11:00~12:00 
指定閱讀
教師自編上課講義,於第一次上課時配發。 
參考書目
(837b)Stefan TH. Gries. 2009. Quantitative Corpus Linguistics with R: A Practical Introduction. Routledge.
(837b)R.H. Baayen. 2008. Analyzing Linguistic Data: A Practical Introduction to Statistics using R. Cambridge.
(837b)K. Johnson. 2008. Quantitative Methods in Linguistics. Oxford: Blackwell.
 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
報告與討論 
30% 
 
2. 
習題作業 
30% 
 
3. 
期末計畫與報告 
40% 
 
 
課程進度
週次
日期
單元主題
第1週
  課程介紹 
第2週
  Corpus Data Processing: Introduction 
第3週
  語料庫與詞彙資源介紹(CELEX, Chinese and English Wordnets, Sinica Corpus) 
第4週
  語料類型與描述(1) 
第5週
  語料類型與描述(2) 
第6週
  語料處理之前置作業(1) 
第7週
  語料處理之前置作業(2) 
第8週
  語料處理之前置作業(3) 
第9週
  語料統計模式(1) 
第10週
  語料統計模式(2) 
第11週
  語料統計模式(3): Linear Models 
第12週
  語料的視覺化 
第13週
  語言學經驗研究之方法論 
第14週
  簡易語言網路資料庫設計 (1) 
第15週
  簡易語言網路資料庫設計 (2) 
第16週
  簡易語言網路資料庫設計 (3) 
第17週
  期末綜合討論 
第18週
  期末報告